Работа посвящена прогнозированию развития эпидемии COVID-19 с помощью нового метода рандомизированного машинного обучения. Основу метода составляет идея оценивания распределений вероятностей параметров модели по реальным данным вместе с распределением вероятностей измерительных шумов. Энтропийно-оптимальные распределения соответствуют состоянию максимальной неопределенности, что позволяет использовать получаемые в итоге прогнозы, как прогнозы наиболее ``негативного'' сценария исследуемого процесса. Полученные оценки параметров и шумов, которые представляют собой распределения вероятностей, необходимо генерировать, получая таким образом ансамбль траекторий, который требуется анализировать статистическими методами. Для целей такого анализа проводится вычисление средней и медианной по ансамблю траектории, а также траектории, соответствующей средним по распределению значениям параметров модели. Предлагаемый подход используется для прогнозирования общего количества инфицированных с помощью трехпараметрической логистической модели роста. Проведенный эксперимент основан на реальных данных о распространении COVID-19 в нескольких странах Европейского союза. Основной целью эксперимента является демонстрация энтропийно-рандомизированного подхода для прогнозирования эпидемического процесса на основе реальных данных вблизи пика. Существенная неопределенность, содержащаяся в доступных реальных данных моделируется аддитивным шумом в пределах 30%, который используется как на этапе обучения модели, так и при прогнозировании. Для настройки гиперпараметров модели используется схема их настройки по тестовой выборке с последующим переобучением. Показано, что при одинаковых наборах данных, предлагаемый подход позволяет более эффективно прогнозировать развитие эпидемии по сравнению со стандартным подходом, основанным на методе наименьших квадратов.
В статье описаны результаты обработки статистических данных из открытых источников по развитию эпидемии COVID-19 и выполненного исследования по определению места и времени начала ее в России. В интересах предлагаемого исследования дан обзор существующих моделей процессов развития эпидемии и методов решения прямых и обратных задач его анализа. Предложена модель развития эпидемии COVID-19 в сети из девяти городов России: Москва, Санкт-Петербург, Нижний Новгород, Ростов-на-Дону, Краснодар, Екатеринбург, Новосибирск, Хабаровск, Владивосток. Города выбраны как по географическому положению, так и по количеству населения в них. Модель состоит из двадцати семи дифференциальных уравнений. Разработан алгоритм обратного анализа модели эпидемии. В качестве исходных данных для решения задачи выступали сведения по численности населения городов, интенсивности переходов процесса из одних состояний в другие, а также данные по инфицированности населения на заданные моменты времени. В статье также приводятся результаты детального анализа подходов решения к моделированию развития эпидемий по видам моделей (базовая модель SEIR, модель SIRD, адаптивная поведенческая модель, модифицированные SEIR-модели), и по странам (в Польше, во Франции, Испании, Греции и других), а также обзор прикладных задач, которые можно решить, используя моделирование распространения эпидемий. Рассматриваются дополнительные параметры среды, которые влияют на моделирование распространения эпидемий и могут учитываться для повышения точности результатов. По результатам моделирования установлены наиболее вероятные города-источники начала эпидемии в России, а также момент ее начала. Достоверность полученных оценок во многом определяется достоверностью использованных статистических данных по развитию COVID-19, находящихся в открытом доступе.
1 - 2 из 2 результатов